深度學習尤其在電腦視覺領域取得了很大的進展,
先一張圖來理解各種電腦視覺的任務:
基本上是從左到右越來越難,
在這圖像分類領域有一個很有名的競賽叫ImageNet,
圖像分類問題就是給你一張圖片,你要告訴我那是什麼東西,
ImageNet總共要分辨1000類的東西,包含各種動植物、常見物品、汽車飛機等等...
甚至哪一種品種的貓都要正確分類出來。
人工智慧的熱潮,大約從2012年開始爆發(再度),
因為深度學習在電腦視覺領域有很大的突破(convolutional neural network,CNN),
從2011年的26%錯誤率到現在只有不到3%的錯誤率,而目前已經超越人類的水準,
我們也已經可以在日常生活中看到應用,
你用Google圖片搜尋引擎,可以跟你說那是什麼東西,
或是你上傳照片到FB,他會自動標注照片裡面有幾個人或是有誰。
另外,還有物件辨識(Object Detection)也有很大的突破,物件辨識比分類更難,
一張圖上可能有很多物件,不僅要辨識出是哪種東西,還要找到他們的位置。
明天會介紹物件辨識領域中很有名的演算法YOLO。